pandas统计重复值次数

最新推荐文章于 2024-09-13 08:50:19 发布

Mr番茄蛋

最新推荐文章于 2024-09-13 08:50:19 发布

阅读量4.8w

点赞数 10

分类专栏： python pandas 文章标签： python pandas

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35203425/article/details/80830911

版权

python 同时被 2 个专栏收录

86 篇文章 6 订阅

订阅专栏

10 篇文章 0 订阅

订阅专栏

pandas统计数据项重复值次数和删除

from pandas import DataFrame



df = DataFrame({'key1':['a','a','b','b','a','a'],
                'key2':['one','two','one','two','one','one'],
                'data1':[1,2,3,2,1,1],
                # 'data2':np.random.randn(5)
                })
# 打印数据框
print(df)
#   data1 key1 key2
# 0      1    a  one
# 1      2    a  two
# 2      3    b  one
# 3      2    b  two
# 4      1    a  one
# 5      1    a  one

# 重复项
print(df[df.duplicated()])
#    data1 key1 key2
# 4      1    a  one
# 5      1    a  one

# 统计重复值
dup=df[df.duplicated()].count()
print(dup)	# 最后两项重复
# data1    2
# key1     2
# key2     2

# 去除重复项
nodup=df[-df.duplicated()]
print(nodup)
#    data1 key1 key2
# 0      1    a  one
# 1      2    a  two
# 2      3    b  one
# 3      2    b  two

关注

10
点赞
踩
55

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Mr番茄蛋 CSDN认证博客专家 CSDN认证企业博客

码龄8年

181: 原创

3万+: 周排名

204万+: 总排名

133万+: 访问

: 等级

1万+: 积分

405: 粉丝

625: 获赞

369: 评论

2355: 收藏

私信

关注

热门文章

分类专栏

C/C++ 11篇
Linux 14篇
教程 20篇
知识点 1篇
R语言 1篇
算法 17篇
生物信息 11篇
python 86篇
pycharm 5篇
mysql 3篇
tensorflow 20篇
trick 1篇
re 3篇
正则匹配 2篇
NLP 9篇
java 7篇
问题解决 40篇
git 1篇
pandas 10篇
shell 3篇
IT 3篇
知识科普 7篇

最新评论

TCGA数据下载教程：使用官方gdc-client软件下载
纤巧星恨: 朋友老铁家人！linux怎么下载啊！
TCGA数据下载教程：使用官方gdc-client软件下载
adisener: 参考这篇帖子 https://blog.csdn.net/weixin_45640009/article/details/131712034?ops_request_misc=&request_id=&biz_id=102&utm_term=Data%20Transfer%20Tool%E7%82%B9%E5%BC%80%E7%A8%8B%E5%BA%8F%E9%97%AA%E9%80%80&utm_medium=distribute.pc_search_result.none-task-blog- 2~all~sobaiduweb~default-0-131712034.142^v100^pc_search_result_base9&spm=1018.2226.3001.4187
TCGA数据下载教程：使用官方gdc-client软件下载
求是~: 您好，请问一下就是这里断开了，然后删掉刚刚断了的那一个，重新输入命令后，gdc-client会跳过我前面下载的东西吗？或者说，我需要全部删掉下载的文件，再重新下载？
Python脚本下载TCGA大数据，非常简单，开放源代码
惜咖啡: {"message":"Your token is invalid or expired. Please get a new token from GDC Data Portal."} 提示这个是什么情况
pip换源添加多个国内源方法
NanCoCo: https://l-fay.github.io/2020/11/27/anaconda00/

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。